根据样本推断总体的分布和分布的数字特征称为统计推断。我们来讨论统计推断的一个基本问题——参数估计。参数估计有两类, 一类是点估计, 就是以某个统计量的样本观察值作为未知参数的估计值; 另一类是区间估计, 就是用两个统计量所构成的区间来估计末知参数。
我们在估计总体均值的时候, 用样本均值作为总体均值的估计, 就是点估计。 在做置信区间估计之前, 必须先规定一个置信度, 例如 $95 \%$ 。置信度以 1-alpha 表示, 这里 的 alpha 就是假设检验里的显著性水平。因此 $95 \%$ 的置信度就相对于 $5 \%$ 的显著性水平。 置信区间估计的一般公式为:点估计 关键值 $\times$ 样本均值的标准误 $$ \bar{x} \pm z_{\alpha / 2} \cdot \frac{s}{\sqrt{n}} $$ 这里的关键值就是以显著性水平 $\alpha$ 做双尾检验的关键值。关键值是 $z$ 关键值或 $t$ 关键 值。究竟是 $z$ 关键值还是 $t$ 关键值, 如表所示。
$$ \begin{array}{ccc} \hline \text { 项 目 } & \text { 正态总体 } n<30 & n>=30 \\ \hline \text { 已知总体方差 } & z & z \\ \text { 末知总体方差 } & t & t \text { 或 } z \\ \hline \end{array} $$假设一位投资分析师从股权基金中选取了一个随机样本, 并计算出了平均的夏普比率。 样本的容量为 100 , 并且平均的夏普比率为 $0.45$ 。该样本具有的标准差为 $0.30$ 。利用一个 基于标准正态分布的临界值,计算并解释所有股权基金总体均值的 $90 \%$ 置信区间。这个 $90 \%$ 的置信区间的临界值为 $z_{0.05}=1.65$, 故置信区间为 $\bar{x} \pm z_{0.05} \frac{s}{\sqrt{n}}=0.45 \pm 1.65 \times \frac{0.30}{\sqrt{100}}$, 即 $0.4005 \sim 0.4495$, 分析师可以说有 $90 \%$ 的信心认为这个区间包含了总体均值。
参考资料: